# 1、创建环境
from pyspark.context import SparkContext

sc = SparkContext(master='local', appName='spark')

# 2、读取数据
students_rdd = sc.textFile("../../data/students.txt")

# 获取文科一班的学生
# filter: 过滤数据,将数据一行一行传递给后面的函数,如果函数返回True保留数据,如果函数返回False过滤数据
filter_rdd = students_rdd.filter(lambda line: line.split(",")[-1] == "文科一班")

filter_rdd.foreach(print)
